摘要随着大语言模型(LLM)驱动的AIAgent从单体应用走向多智能体协作,一个被严重低估的问题浮出水面:当Agent数量从1增长到1000,我们需要怎样的基础设施来管理它们? 本文通过"虾社会"这一隐喻,系统性地探讨了Multi-Agent系统的公共基础设施设计。 我们首先实现了5个装载在单个Agent上的治理技能(Skill),随后通过推敲发现了个体能力的三个根本局限——自我审计悖论、身份管理碎片化、全局视角缺失——进而提出了独立于Agent的公共基础设施架构。 在推敲过程中,我们发现了一个关键的规模悖论:用户类型Agent数量需要公共基础设施?有能力建设? 我们的结论更进一步:对于Multi-Agent平台(如AutoGen、CrewAI),公共基础设施应该是平台级能力,而非用户自建的组件。
例如,金融风控场景中,信贷审核 AI Agent 若存在决策偏差,可能错误批准高风险贷款申请,给金融机构带来重大风险。(2)业务层面Agent 的表现直接影响业务开展与价值实现。 (2)决策准确率(Decision Accuracy)计算公式:决策准确率正确决策步骤数总决策步骤数应用场景:医疗辅助场景:AI 诊断 Agent 分析病历、影像报告时,症状匹配、疾病排除等关键推理步骤的正确比例 1.4.3 τ-bench (Tau-bench)τ-bench 是评估 AI 智能体在真实世界环境中可靠性的基准测试,核心是模拟 “用户–Agent–工具” 三方多轮交互,衡量 Agent 在真实业务场景中完成任务的可靠性 2.4 例 3 - 使用自定义 TaskManager 对 AI 考题生成 Agent 执行评估2.4.1 Agent 场景AI 考题生成 Agent 支持多题型(单选、多选、填空)、多难度(简单、中等 总结Agentic AI 评估是确保 AI 智能体安全可靠运行的关键环节。
大数据产业创新服务媒体 ——聚焦数据 · 改变商业 大模型与智能体的兴起,对数据提出了根本性的新要求,也推动数据基础设施向更高层次演进。 在此背景下,“第八届金猿大数据产业发展论坛——暨AI Infra & Data Agent趋势论坛”于1月14日在上海成功举办。 “当前基础设施下,单条数据可能本身无误,但因多样性不足等原因,无法直接应用于智能场景。 在推动AI落地业务时,应积极构建数据基础设施,打通“用户反馈-场景数据-模型迭代”闭环,真正让数据流动起来、让模型持续进化,最终驱动业务实现可衡量的增长。 上海纽约大学信息技术部高级主任 常潘 支撑未来智能 数据基础设施还需要哪些突破?
一、 产品定位与核心亮点 腾讯云Agent Runtime 是一项专为AI Agent设计的原生基础设施服务。其核心技术属性是通过提供会话独占运行环境,解决Agent任务对云基础设施的特殊需求。 商业差异化卖点在于确保Agent能够跑得快、跑得省、跑得放心。 二、产品应用场景 AI模型研发企业(如MiniMax):在进行大模型训练时,需要高效、大规模地生成训练语料。 寻求业务智能升级的企业(如法律咨询平台):希望将传统Web应用快速升级为具备AI交互能力的Agent,但面临基础设施部署复杂、开发周期长的困境。 荣誉背书 (原文未提及具体技术荣誉和奖项) 四、典型案例 案例一:MiniMax × Agent沙箱 背景:AI公司MiniMax需要为大模型训练高效生成大量结果语料,传统方式效率低下。 案例三:法律咨询平台 × Agent原生基础设施 背景:法律服务平台希望快速构建AI法律咨询助手以提升服务能力。
一、产品定位与核心亮点 腾讯云Agent Runtime 是腾讯云推出的面向AI Agent(智能体)场景的原生基础设施,核心定位为通过重构云基础设施适配Agent任务负载特征,实现Agent“跑得快、 应用开发者(如WorkBuddy) 长周期Agent任务执行 任务中断后需重新执行,成本高;任务暂停时资源持续计费,资源浪费 垂直行业服务平台(如法律服务平台) 垂类Agent(如AI法律咨询助手)搭建与现有系统接入 基础设施配置复杂,Agent上线周期长(数周级);现有Web业务与Agent业务链路割裂,管理成本高 企业级Agent应用运营方 企业数据访问、Agent任务监控 企业数据访问安全风险高;Agent任务链路不可观测 案例3:EdgeOne Makers × 一站式Agent上线方案 背景:EdgeOne Makers需搭建AI法律咨询助手Agent,并接入现有法律服务平台,传统模式下基础设施配置复杂,Agent上线需数周 解决方案: 搭建阶段:基于腾讯云Agent Runtime模版改造,集成沙箱工具、记忆、可观测、模型等开箱即用能力,无需配置复杂基础设施。
引言Agentic AI 代表了自主系统的重大进步,在大型语言模型(LLM)和生成式人工智能(Generative AI)的支持下日益成熟。 OWASP 生成式 AI 安全工作组推出的 Agentic 安全行动(Agentic Security Initiative,ASI),提供了基于威胁模型的新兴 Agent 威胁参考及缓解措施,为安全防护提供了重要依据 本文聚焦 Agentic AI 技术及组件带来的特有安全威胁,需明确:传统网络安全控制措施、生成式 AI 安全控制措施仍然适用且必要。 Agentic AI 的内存和工具集成是两大核心攻击向量:内存易受投毒攻击,工具可能被滥用;在不受约束的自主性环境或多 Agent 架构中,这些风险会进一步放大。 T14多 Agent 系统中的人类攻击(Human Attacks on Multi-Agent Systems)利用 Agent 间委托关系、信任机制和工作流依赖,提升权限或操纵 AI 操作。
讲者信息:马文霜(腾讯云存储总经理) 发布场景:中关村论坛系列活动 一、 产品定位与核心亮点 腾讯云 Agent Runtime 是一款专为 AI Agent 打造的原生云基础设施。 其商业差异化卖点在于彻底重构了传统云基础设施的资源调度逻辑,通过实现毫秒级启动与极致弹性,解决了大模型训练与 Agent 应用在规模化部署中面临的运行速度、资源成本及数据隐私问题。 企业级办公与日常 Agent 调度场景:解决 AI 执行长任务易出错导致的数据丢失问题,以及 Agent 闲置时持续占用云资源带来的高昂成本。 Web 应用智能化升级场景:解决传统 Web 架构接入 AI 模型时面临的底层基础设施配置复杂、研发周期长、系统延迟高及安全链路不可控的困境。 三、 应用框架和功能介绍 1. 案例三:EdgeOne Makers 背景:开发者及企业(如在线法律服务平台)面临从传统 Web 应用向 AI Agent 升级的诉求,但自建基础设施配置复杂、研发周期长。
AI Agent 记忆类型智能体的记忆系统主要分为短期记忆和长期记忆两大类。 Mem0Mem0是专为AI Agent设计的开源记忆框架,通过智能记忆管理帮助Agent实现状态持久化。 LangMem 的高级特性包括主动记忆管理、共享内存机制、命名空间组织和个性化持续进化能力,使 AI Agent 能根据重要性动态存储信息,支持多个 Agent 之间的知识共享,高效组织检索信息,并不断适应用户需求变化 中的记忆模块帮助开发者更快捷地为AI Agent赋能记忆功能。 这一完全托管的记忆基础设施让开发者无需自己搭建数据库或向量存储,就能方便地让 Agent 拥有记忆功能。
随着 Anthropic 发布 Dynamic Workflows,允许单个指令触发数百个子 Agent 并行执行,整个 AI 圈似乎又一次陷入了宏大叙事的狂欢。 在 AI Agent 这个全新的应用范式下,微服务架构不仅是杀鸡用牛刀,更可能是一剂毒药。 而那个通常被认为是“玩具”或“移动端专用”的单文件数据库——SQLite,正在成为重塑 Agent 基础设施的完美答案。 ··· 一、剥开 Agent 的本质:为什么分布式是伪需求? 但 AI Agent 的工作流,其物理特性与高并发 Web 业务截然不同。 首先,绝大多数 Agent 是“单体焦点(Single-Tenant Focus)”的。 ··· 结语:在 AI 泡沫中找回工程理性 科技行业总是在钟摆的两端摇摆。在 AI 厂商拼命卷模型参数、造出越来越花哨的 Agent 编排框架时,一线工程师正在悄悄用脚投票。
从API到Agent:MCP协议如何成为AI互联互通的新基础设施大家好,我是摘星。今天我们来聊聊一个正在悄悄改变AI游戏规则的东西——MCP协议。 过去一年里,AI圈有个很明显的变化:大家不再只是调API玩玩了,而是开始折腾「Agent」。 这个架构里有三个核心角色:Host(主机):AI应用的运行环境,比如ClaudeDesktop、你写的Agent程序。负责整体调度。 5.3我的判断MCP会成为AIAgent领域的基础设施,但不会是唯一解。短期来看(1-2年),MCP最有可能成为「工具调用层」的事实标准——就像RESTfulAPI在Web服务中的地位。 核心结论就三条:1.MCP解决的是AI应用层的「碎片化」问题。它定义了一套标准协议,让任何AI模型可以用同一种方式连接任何外部工具。2.MCP的架构设计很务实。
今天是9月11日星期四,让我们一起来看看今天 Ai Agent 带来的 AI 领域的重要动态吧! *角色定义*:明确AI Agent在企业中的定位和职责 *数据整合*:确保AI Agent能够访问高质量的相关数据 *行动规划*:设计Agent能够执行的具体任务和流程 *反馈机制*:建立持续学习和优化的闭环系统 AI Agent,但未来将是多Agent流程的天下 这一工具代表了从传统工作流自动化向AI增强流程的重要转变,为企业提供了更灵活、更智能的自动化解决方案。 AI Agent时嵌入运行时安全,为AI原生开发提供更可靠的安全保障。 文章提到,代理式AI应用正在兴起,例如德勤的Zora AI Agent和普华永道的Agent OS平台正在重塑内部工作流程。
一个普遍的误区是,认为工具越多Agent能力越强,但其实这会给Agent有限的上下文与决策系统带来巨大的认知负荷。 正确的思路是,少即是多。 这本质上,是将部分Agent的规划责任,前置到工具的设计当中,是一种责任转移的思路。 当工具库膨胀之后,命名混乱与功能重叠,会让Agent无所适从,通过命名空间来组织工具。 需要打磨工具的描述,因为这些描述是Agent理解工具的唯一信息来源。 工具描述,应将所有隐含的知识显性化、力求清晰、无歧义。 结构化命名,相当于为Agent提供了一张清晰的地图,帮助在正确的场景下,快速定位合适的工具。 同样,工具返回给Agent的内容质量,远比数量更重要。 因为Agent比人类更擅长理解的的内容,也是人类可读的、具有意义的文本,这些高质量内容,可以显著降低Agent在检索任务中的幻觉。 Agent与工具的交互,本质上是一个持续对话场景。
应对规模化 Agent 部署的治理与成本失控挑战 随着 AI 技术从 Chatbot、Copilot 演进至 Agent 元年(2025)及规模化部署元年(2026)(Sam Altman, OpenAI Gartner 预测 到 2028 年,33% 的企业软件将集成 Agentic AI,且 70% 的数字工作流将由 Agent 协作完成(McKinsey, 2025)。 具体的企业级瓶颈体现在: 基础设施失配:传统 Infra 服务于“人”,无法适配 Agent 时代的突发并发、短任务、高频小调用及长会话特性。 安全防护:配套 Skill 三重扫描(静态杀毒+AI语义+沙箱动态),恶意 Skill 检出率达 95%,高危命令实时拦截,决策链路<1分钟可溯。 算力性价比:自研 CVM Ai2 智能型机型,刊例价仅为标准型的 40%,显著降低推理成本。
随着生成式AI技术的不断进步,关于其未来发展方向的讨论也愈发激烈。究竟生成式AI的未来是在对话系统(Chat)中展现智慧,还是在自主代理(Agent)中体现能力?这一问题引发了广泛的讨论和探索。 一、生成式AI在对话系统(Chat)中的发展方向 1. 多模态对话系统 2.1 语音交互 对话系统将整合语音识别和生成技术,使用户能够通过语音与AI进行对话,同时AI可以通过语音反馈,提供更加自然的交互体验。 二、自主代理(Agent)的发展方向 1. 自主决策和执行能力 1.1 环境感知 自主代理通过传感器和数据分析,实时感知周围环境的变化,从而做出适应性决策。 伦理与政策 随着生成式AI的广泛应用,伦理问题和政策法规将变得越来越重要。如何确保AI的公平性、安全性和隐私保护,将是未来发展的重要课题。 总的来说,生成式AI的未来充满了无限可能。
在当今科技浪潮中,人工智能(AI)深度融入生活与工作的背后,AI Agent(智能体) 是支撑从对话助手到自主任务程序的核心概念——它不是单纯的聊天工具,而是能像数字员工一样接任务、拆步骤、执行动作的自动化实体 ,只要任务可拆解为操作流程,就能被 AI Agent 接管。 Agent 与传统 AI 模型的区别 维度 传统 AI 模型 AI Agent 交互方式 单次输入输出 多轮对话、持续交互 决策能力 基于输入直接推理 规划、反思、迭代优化 工具使用 无法主动调用外部工具 AI Agent 构成:像人一样思考与行动 一个功能完整的 AI Agent 通常模仿人类的认知和行动循环,包含以下几个关键模块: 1、规划模块:任务的大脑与指挥官 这是 Agent 的思考中枢。 多个 Agent 可以协同工作,类似一个团队: AI Agent 的主要类型与应用场景 根据其复杂度和自主性,AI Agent 可以分为不同类型,应用于各种场景: 类型 特点 应用场景举例 单一任务
在即将举行的 SelectDB 产品发布会上,我们也将围绕这一变化做一次更系统的分享:当 Agent 成为新的应用范式,企业的数据基础设施需要发生哪些改变?实时分析引擎在其中承担什么角色? 二、软件的三种形态:从规则,到训练,再到驾驭要理解 Agent 时代对数据基础设施意味着什么,我们需要先退一步,看清软件本身的演化逻辑。过去几十年里,软件制造智能大致经历了三次变化。 变化在于,它正在从前台的主角,变成更偏后台的基础设施。而走向前台的,是那些能在 Agent 推理循环中直接创造价值的数据系统——实时 OLAP 引擎。 可以确定的是,当 Agent 真正进入生产系统,企业对数据基础设施的要求会发生根本变化。 在即将举行的 SelectDB 产品发布会上(6月11日,14:00,视频号:SelectDB ),我们将进一步分享 Doris / SelectDB 在实时分析、混合检索、Agentic Analytics、AI
现有的基础设施难以满足更快的模型推理、更灵活的工具集成以及更可靠的持续守护需求,直接制约了Agent的大规模生产级应用。 部署全栈AI原生引擎与安全运行时沙箱 为解决大模型应用中的系统稳定性与开发效率问题,腾讯云升级智算能力,构建了更贴近Agent的AI原生云软硬协同架构: Agent Infra(运行层构建): 专为大规模 智能运维与风险拦截: 发布 Cloud Mate 云专家服务智能体,将基础设施推向主动服务跃进。 支撑实体产业与泛互联网核心业务系统 该套AI原生云基础设施已在多行业、多场景中得到大规模实际业务验证。 确立亚太区智算基石的权威认证优势 腾讯云在AI云基础设施领域的架构优化与技术确定性,获得了全球权威机构的量化认可。
而面对 Agent 时代,数据基础设施的范式也发生了新变化。 Data&AI 数据基础设施,才是 AI 时代 Infra 新范式 在大模型落地千行百业的当下,数据对于企业的重要性不亚于模型的重要性。 新一代 Data&AI 数据基础设施与传统大数据平台 / 数据基础设施的代际差异 一方面,数据与平台要协同起来。 数据与 AI 不再是分离的两套系统,而是基础设施的一体两面,更准确地说,Data&AI 数据基础设施,才是 AI 时代 Infra 新范式。 ,来加速 Data&AI 基础设施的融合。 平台面向大型组织进行数据与 AI 体系化落地,提供数据集成、离线实时开发、多模态计算、数据治理、数据集管理、AI 模型构建、训推一体至 Agent 开发全链路闭环的基础设施产品。
团队层: 项目文档存储于COS对象存储,Agent按权限访问。 企业层: Agent上下文汇入CLS日志服务,运行数据挂载CBS云硬盘持久化,并支持CBS快照秒级回滚。 通过AI下钻功能,可直接定位到会话错误详情,快速排查根因。 会话管理智能化: 支持将单次会话拆解到成本构成与性能瓶颈。 系统能自动识别出会话轮次多、调用Skill频繁的会话,并通过AI进行分析,优化共性问题(如建议启用Prompt Caching以节省0.0025 USD/轮的成本)。 场景四:AI视频人机协同 覆盖文本大纲优化、图片Best-of-N优选、视频生成与剪辑全流程。 五、营销技术全链路的数据与算力支撑 腾讯云企服行业专家郭有春指出,通过算力、AI与数据能力,解决营销素材与程序化广告的核心痛点。
01 智能体的定义 如果说去年是大型语言模型(LLM)的元年,那么今年可以称之为智能体(AI Agent)的元年,根据智能体(AI Agent)架构和组成方式不同,智能体可进一步分为两类: 狭义智能体: 06 结论 如果说去年是大模型的元年,那么今年是智能体的(AI Agent)的元年,与此同时,智能体正推动AI基础设施从“资源规模导向”转向“业务价值创造”。 智能体的规模化落地,对AI基础设施提出了四大全新要求: Agent运行时的支撑:需要云原生架构(如容器和Serverless)来高效、弹性地承载Agent运行时环境。 AI基础设施的演进加速智能体落地:反过来,新一代的AI基础设施正在通过提供“AI Agent服务平台”来加速智能体的落地。 未来的AI基础设施不再仅仅是“卖算力”,而是会提供包括Agent运行时、安全沙箱、可观测性工具、乃至MCP协议栈等开箱即用的技术组件。